Józef Pociecha https://orcid.org/0000-0003-3140-481X
ARTICLE

(English) PDF

ABSTRACT

The starting point for the presentation of the similarities and differences between the principles of conducting statistical research according to the rules of both statistical inference and statistical learning is the paradigm theory, formulated by Thomas Kuhn. In the first section of this paper, the essential features of the statistical inference paradigm are characterised, with particular attention devoted to its limitations in contemporary statistical research. Subsequently, the article presents the challenges faced by this research jointly with the expanding opportunities for their effective reduction. The essence of learning from data is discussed and the principles of statistical learning are defined. Moreover, significant features of the statistical learning paradigm are formulated in the context of the differences between the statistical inference paradigm and the statistical learning paradigm. It is emphasised that the statistical learning paradigm, as the more universal one of the two discussed, broadens the possibilities of conducting statistical research, especially in socio-economic sciences.

KEYWORDS

paradigm theory, learning from data, statistical inference, statistical learning

JEL

C000, C180, C83

REFERENCES

Alexander, M., & Kusleika, R. (2019). Access 2019 PL: Biblia (R. Meryk & T. Walczak, Trans.). Gliwice: Helion.

Bracha, C. (1996). Teoretyczne podstawy metody reprezentacyjnej. Warszawa: Wydawnictwo Naukowe PWN.

Cassel, C. M., Särndal, C. E., & Wretman, J. H. (1977). Fundations of Inference in Survey Sampling. New York: John Wiley & Sons.

Cichosz, P. (2000). Systemy uczące się. Warszawa: Wydawnictwa Naukowo-Techniczne.

Géron, A. (2018). Uczenie maszynowe z użyciem Scikit-Learn i TensorFlow (K. Sawka, Trans.). Gliwice: Helion.

Hastie, T., Tibshirani, R., & Friedman, J. (2009). Elements of Statistical Learning: Data Mining, Inference and Prediction (2nd edition). New York: Springer. https://doi.org/10.1007/978-0-387-84858-7.

Hołda, A., & Pociecha, J. (2009). Probabilistyczne metody badania sprawozdań finansowych. Kraków: Wydawnictwo Uniwersytetu Ekonomicznego.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning: with Applications in R. New York: Springer. https://doi.org/10.1007/978-1-4614-7138-7.

Kim, W., Choi, B. J., Hong, E.-K., Kim, S. K., & Lee, D. (2003). A Taxonomy of Dirty Data. Data Mining and Knowledge Discovery, 7(1), 81–99. https://doi.org/10.1023/A:1021564703268.

Kołakowski, L. (2004). Filozofia pozytywistyczna: Od Hume’a do Koła Wiedeńskiego. Warszawa: Wydawnictwo Naukowe PWN.

Koronacki, J., & Ćwik, J. (2005). Statystyczne systemy uczące się. Warszawa: Wydawnictwo Naukowo Techniczne.

Kot, S. M., Jakubowski, J., & Sokołowski, A. (2011). Statystyka (2nd edition). Warszawa: Difin.

Kubus, M. (2014). Propozycja modyfikacji metody złagodzonego LASSO. Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu / Research Papers of Wrocław University of Economics, (327), 77–84. https://www.dbc.wroc.pl/dlibra/publication/27745/edition/25111/content?&meta-lang=pl.

Kuhn, T. S. (1962). The Structure of Scientific Revolutions. Chicago: University of Chicago Press.

Kuhn, T. S. (2020). Struktura rewolucji naukowych. Warszawa: Wydawnictwo Aletheia.

Migdał-Najman, K., & Najman, K. (2017). Big Data = Clear + Dirty + Dark Data. Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu / Research Papers of Wrocław University of Economics, (469), 131–139. https://doi.org/10.15611/pn.2017.469.13.

Onet. (n.d.). Komputer Świat. Retrieved January 21, 2021, from https://www.komputerswiat.pl/onet.

Pociecha, J. (2020). Philosophical foundations of statistical research. Przegląd Statystyczny. Statistical Review, 67(3), 195–211. https://doi.org/10.5604/01.3001.0014.7109.

Pociecha, J., Pawełek, B., Baryła, M., & Augustyn, S. (2014). Statystyczne metody prognozowania bankructwa w zmieniającej się koniunkturze gospodarczej. Kraków: Fundacja Uniwersytetu Ekonomicznego w Krakowie. https://im.uek.krakow.pl/wp-content/uploads/2020/03/Statystyczne-metody-prognozowania-bankructwa_online.pdf.

Pociecha, J., Podolec, B., Sokołowski, A., & Zając, K. (1988). Metody taksonomiczne w badaniach społeczno-ekonomicznych. Warszawa: Państwowe Wydawnictwo Naukowe.

Russel, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach. New Jersey: Prentice Hall, Pearson Education, Upper Saddle River.

Steczkowski, J. (1995). Metoda reprezentacyjna w badaniach zjawisk ekonomiczno-społecznych. Warszawa–Kraków: Wydawnictwo Naukowe PWN.

Szymczak, W. (2018). Praktyka wnioskowania statystycznego. Łódź: Wydawnictwo Uniwersytetu Łódzkiego.

Tabakow, M., Korczak, J., & Franczyk, B. (2014). Big Data – definicje, wyzwania i technologie informatyczne. Informatyka ekonomiczna / Business Informatics, (1), 138–153. https://doi.org/10.15611/ie.2014.1.12.

Tibshirani, R. (1996). Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society. Series B (Methodological), 58(1), 267–288. https://doi.org/10.1111/j.2517-6161.1996.tb02080.x.

Tillé, Y. (2006). Sampling Algorithms. New York: Springer. https://doi.org/10.1007/0-387-34240-0.

Vapnik, V. N. (2000). The Nature of Statistical Learning Theory (2nd edition). New York: Springer- Verlag. https://doi.org/10.1007/978-1-4757-3264-1.

Back to top
© 2019–2022 Copyright by Statistics Poland, some rights reserved. Creative Commons Attribution-ShareAlike 4.0 International Public License (CC BY-SA 4.0) Creative Commons — Attribution-ShareAlike 4.0 International — CC BY-SA 4.0